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目前 对 玉米 出 苗 动 态 检测 
解决 人 工 出 苗 动 态 管理 不 


平台 获取 的 高 时 序 可 见 光 图 像 和 无 


苗 过 程 图 像 数据 集 。 考 虑 到 田间 存 


残 差 单元 


行 出 苗 动 态 连续 监测 ， 


， 使 


J ResNet50 作为 新 的 


对 各 玉米 品 


监测 了 


P 心 数字 植物 北京 市 重点 实 


E 要 是 依靠 人 工 观测 ， 耗 时 耗 力 且 只 能 选择 小 的 样 方 估 算 整 体 出 苗 


精准 的 问题 ， 实 现 田间 精细 化 管理 ， 本 研究 以 田间 作物 表 型 高 通 量 采集 


人 机 平台 获取 的 可 见 光 图 像 两 种 数据 源 构 建 了 不 同 光照 条 件 下 的 玉米 出 
在 环境 背景 复杂 、 光 照 不 均等 因素 ， 在 传统 Faster R-CNN 的 基础 上 构建 
特征 提取 网 络 来 对 Faster R-CNN 进行 优化 ， 首 先 实现 对 复杂 田间 环境 下 
玉米 出 苗 识 别 和 计数 ; 进而 基于 表 型 平台 所 获取 的 高 时 序 图 像 数据 ， 对 不 同 品种 、 不 同 密度 的 玉米 植株 进 
种 的 出 苗 持 续 时 间 和 出 苗 整 齐 度 进行 评价 分 析 。 试 验 结果 表明 ， 本 研究 


提出 的 方法 应 用 于 田间 作物 高 通 量 
应 用 于 无 人 机 平台 出 苗 检 测 时 晴天 和 阴 天 的 识别 精度 分 别 91.43% 和 89.77%， 可 以 满足 实际 应 用 场景 下 玉米 


出 苗 自 动 检测 的 需求 。 利 
表明 利用 本 模型 得 到 的 动态 4 


汉化 性 。 


表 型 平台 出 苗 检测 时 ， 
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步 进行 了 


崩 天 和 阴 天 的 识别 精度 分 别 为 953.67% Fil 91.36% ; 


E 米 动态 出 苗 检 测 分 析 ， 结 


具有 一 致 性 ， 说 明 本 研究 提出 的 模型 的 具有 和 鲁 棒 性 和 
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1 引言 


作物 出 苗 是 影响 田间 管理 决策 的 重要 农艺 因 
素 ， 通 过 监测 出 苗 情 况 可 在 正确 的 时 间 进 行 补 种 
以 减少 损失 ，。 传 统 上 ， 通 常 通过 用 少数 采样 点 
进行 目 视 观 察 (人 工 计 数 ) 来 估 测 作物 出 苗 数 
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量 ”“， 既 费时 又 费力 ， 无 法 覆盖 大 的 生产 领域 。 
随 着 图 像 获取 方式 的 进步 ， 计 算 机 视觉 技术 在 作 
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物 生 长 检测 中 的 应 用 得 到 了 广泛 的 关注 。 获 
取 高 分 辨 率 的 特定 地 点 作物 出 苗 信 息 是 实施 精确 
田间 管理 的 基础 。 同 时 ， 准确 的 作物 出 苗 信 息 可 
用 于 了 解 土壤 和 环境 对 作物 出 昔 的 影响 “。 因 
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此 ， 为 提高 监测 效率 ， 近 距离 遥感 技术 被 用 来 评 
估 作 物 出 苗 情 况 。 基 于 无 人 机 图 像 数 据 进行 的 出 
苗 检 测 方 法 ,在 各 种 作物 中 得 到 了 广泛 的 应 
用 所 。 目 前 使 用 无 人 机 对 作物 出 苗 的 研究 主要 集 
中 在 出 苗 数 量 和 均匀 性 上 ”。 

21 世 纪 以 来 ， 成像 技术 的 发 展 为 高 通 量 植物 
表 型 平台 (Plant High-throughput Phenotypic Plat- 
form, HTPP) 的 开发 提供 了 机 会 。1998 年 ， 比 
利 时 CropDesign 公 司 成 功 开 发 世界 上 首 套 大 型 植 
物 高 通 量 表 型 平台 ， 命 名 为 TraitMill"”。2016 
年 ,德国 Lemna Tec 公 司 开发 了 第 一 个 产品 级 田 
间 高 通 量 植物 表 型 平台 Scanalyzer Field ""， 标 志 
着 植物 表 型 获取 技术 正式 走向 大 田 测 量 。 高 通 量 
表 型 平台 的 高 通 量 、 自 动 化 、 高 精度 等 特点 ， 极 
大 地 提高 了 作物 图 像 采集 的 效率 和 准确 性 ， 同 时 
也 为 玉米 出 苗 动 态 监测 提供 了 新 的 研究 手段 。 

近年 来 ， 随 着 卷 积 神经 网 络 的 发 展 ， 深 度 学 
习 已 在 自然 语言 处 理 '、 图 像 识 别 中 、 视 频 跟 
Be) 等 领域 超越 了 传统 的 机 器 学 习 算 法 。 在 农 
业 领 域 ， 卷 积 神经 网 络 较 强 的 图 像 特征 提取 能 
也 使 越 来 越 多 的 研究 人 员 将 深度 学 习 应 用 于 作物 
表 型 信息 获取 ERY RE") 等 领域 。 深 
度 学 习 模 型 已 经 用 于 从 无 人 机 、 地 面 机 器 人 系 
统 收集 的 图 像 数 据 集中 提取 隐藏 信息 ， 以 监测 
EWEA | 和 预测 产量 '。 一 些 流行 的 深度 
学 习 模型 AlexNet '”’, VGG', GoogleNet °" 和 
ResNet ”等 被 用 于 处 理 农业 中 的 复杂 数据 。 基 
于 卷 积 神经 网 络 的 目标 检测 算法 如 YOLO 和 
SSD ”一 阶 检测 器 系列 和 Faster R-CNN °°) 两 阶 
检测 系列 已 被 证 实在 对 作物 出 苗 检 测 上 取得 了 不 
错 的 效果 。 

根据 以 上 分 析 ， 本 研究 目的 是 利用 田间 作物 
表 型 平台 获取 的 高 时 序 、 连 续 可 见 光 图 像 以 及 无 
人 机 平台 获取 的 可 见 光 图 像 构建 数据 集 ， 提 出 基 
于 卷 积 神经 网 络 (Convolutional Neural Network, 
CNN) 的 图 像 特征 自动 提取 方法 ,实现 对 复杂 的 
田间 环境 下 玉米 幼苗 的 快速 准确 识别 ， 为 玉米 田 
间 智 能 耕作 管理 提供 技术 储备 。 基 于 优化 的 Fast- 


er R-CNN 模型 来 实现 玉米 出 苗 检测 ， 结 合 非 极 
大 值 抑 制 方法 (Non-Maximum Suppression, 
NMS) 对 单位 面积 的 玉米 幼苗 进行 计数 。 依 据 
表 型 平台 的 时 序 图 像 实现 不 同 玉米 品种 的 出 苗 动 
态 监 测 ， 以 此 来 判断 出 不 同 品种 玉米 的 出 苗 特 征 
及 差异 ， 并 对 两 种 平台 的 出 苗 检测 精度 进行 验证 
比较 。 


2 材料 与 方法 


2.1 图 像 采集 


研究 分 别 使 用 无 人 机 平台 和 田间 作物 表 型 高 
通 量 采集 平台 (轨道 式 ) 搭载 可 见 光 传感器 进行 
高 通 量 原始 图 像 数 据 获取 。 因 此 ， 图 像 采 和 集 试验 
分 为 两 部 分 ， 其 中 试验 一 使 用 无 人 机 平台 进行 图 
像 获取 ,试验 二 使 用 田间 作物 表 型 高 通 量 采集 平 
台 进 行 图像 获 取 。 
2.1.1 无 人 机 可 见 光 图 像 采 集 

试验 一 于 2018 年 在 北京 市 通州 区 实验 基地 
开展 (39%56' N，116"16' E), {EJM KIE M600 
Pro 六 旋 恤 无 人 机 作为 图 像 采 集 平 台 ， 搭 载 型 号 
为 SONY-5100 的 相机 (采用 20 mm 的 定制 机 械 
镜头 ) 对 试验 田 内 玉米 苗 期 冠 层 图 像 进行 采集 。 
考虑 到 小 型 无 人 机 的 续航 能 力 和 图 像 的 分 辩 率 等 
问题 ， 设 置 无 人 机 的 飞行 高 度 为 30 m， 航 向 重 
县 度 为 70%， 旁 癌 重 三 度 为 65%。 试 验 的 采集 时 
间 为 2018 年 5 月 8 日 (出苗 ) 至 2018 年 5 月 23 
日 。 考 虑 所 获取 图 像 的 质量 问题 ， 选 择 在 无 风 或 
者 微风 的 时 候 用 无 人 机 采集 数据 。 所 获取 的 可 见 
光 原 始 图 像 分 辨 率 为 5280X3956 px。 图 1 展示 了 
无 人 机 实物 图 、 田 间 场 景 图 以 及 无 人 机 获取 可 见 
光 图 像 。 
2.1.2” 表 型 平台 可 见 光 图 像 采 集 

试验 二 在 北京 市 农林 科学 院 试验 田 内 开 
展 (39°56'N，116°?16'E)。 试验 二 地 块 长 15 m, 
宽 6m。 在 其 上 方 搭 建 了 数字 植物 北京 市 重点 实 
验 室 自主 研发 的 田间 作物 高 通 量 表 型 平台 (轨道 
式 )。 在 平台 的 履 盖 范围 内 种 植 了 AD268 和 XD20 
两 个 玉米 品种 ， 每 个 品种 分 别 以 25,000 株 /ha， 
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(a) 无 人 机 数据 采集 装置 (b) 田 间 场 景 (c) 无 人 机 可 见 光 原 始 图 像 
图 1 无 人 机 图 像 采 集 
Fig. 1 Image collection using UAV 
40,000 P/ha 和 55,000 株 /ha 三 种 密度 进行 种 植 ， ”种 ,种 植 后 以 正常 水 肥 管理 。 图 2 为 地 块 中 种 植 
共计 6 个 小 区 ， 每 个 小 区 种 植 4 行 ， 共 24 行 , 行 。 人 情况 示意 图 。 
长 2.5 m。 两 个 品种 玉米 于 2020 年 7 月 23 日 播 


图 2 田间 作物 高 通 量 表 型 平台 (轨道 式 ) 敌 盖 范 围 内 玉米 种 植 情况 示意 图 
Fig. 2 Schematic diagram of maize planting in the coverage area of HTPP 
ERAP, WEH Microsoft, Kinect ” 别 选 择 上 午 10 点 和 下 午 3 点 两 个 时 间 点 采集 玉米 
V2.0 作 为 成 像 单元 图 像 采 集 设 备 ， 有 效 像素 为 出 苗 冠 层 图 像 ， 所 获取 的 图 像 原始 分 辩 率 为 
500 万 px。 镜 头 垂直 向 下 ， 采 用 自动 曝光 模式 获 = 2048 2048 px。 田 间作 物 高 通 量 表 型 平台 图 像 
取 玉 米 冠 层 图 像 。 图 像 采 集 时 间 从 2020 年 7 月 26 采集 装置 如 图 3 所 示 。 
日 〈 出 苗 ) 开始 到 2020 年 9 月 28 日 止 ， 每 天 分 


(a) 表 型 平台 实景 图 (b) 图 像 采集 设备 (c) 表 型 平台 可 见 光 原始 图 像 
图 3 田间 作物 高 通 量 表 型 平台 图 像 采集 装置 
Fig.3 Field crop high-throughput phenotyping platform image acquisition device 


2.2 数据 集 构建 为 了 便于 模型 训练 ， 将 试验 二 中 获取 的 原始 图 像 
(分 辩 率 为 2048X2048 px) 缩放 至 960X960 px 


2.2.1 图 像 预 处 理 
综合 考虑 硬件 条 件 和 试验 参数 的 需要 ， 同 时 


输入 模型 。 而 为 了 与 田间 作物 高 通 量 表 型 平台 获 
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取 的 图 像 保 持 统一 ， 对 试验 一 中 获取 的 无 人 机 可 
见 光 原始 图 像 (分 辩 率 为 5280X3956 px) 同样 
缩放 至 960X960 px, 采用 滑动 步 长 剪裁 的 方式 
裁 前 图像。 并且 为 了 充分 覆盖 到 遥感 影像 中 目标 
的 信息 ， 裁 剪 时 保证 一 定 的 重 受 度 ， 从 而 能 够 提 
高 模型 后 期 训练 的 效率 和 精度 。 


裁剪 


无 人 机 原始 图 像 (5280X3965 ) 
预 处 理 (960 X 960) 


(a) 无 人 机 图 像 预 处 理 流程 


— 


表 型 平台 原始 图 像 (1920x1080 ) 


预 处 理 (960X960 ) 


使 用 图 像 注 释 工具 LabelImg 对 裁剪 及 缩放 后 
的 图 像 进行 幼苗 的 边界 框 标注 ， 通 过 最 小 外 接 和 矩 
形 将 样本 中 的 玉米 苗 标 出 ， 记 录 该 矩形 的 左上 和 
右 下 的 顶点 坐标 ， 并 设置 类 别 标签 为 seedling。 
图 4 展示 了 数据 从 缩放 、 裁 前 到 标注 的 整体 
流程 。 


标注 


标注 示例 (960X960) 


标注 


标注 示例 (960X960) 


(b) 表 型 平台 图 像 预 处 理 流 程 
图 4 无 人 机 和 田间 作物 高 通 量 表 型 平台 数据 预 处 理 流程 图 
Fig. 4 Data preprocessing flowchart of UAV and HTPP platforms 


2.2.2 ”最 终 数 据 集 组 成 

为 实现 玉米 出 苗 检 测 的 目标 ， 本 研究 选取 试 
验 一 中 玉米 刚 出 昔 时 期 的 无 人 机 获取 的 图 像 作为 
数据 集 ， 即 5 月 8 日 至 5 月 10 日 ,共计 4 天 。 分 
别 选 取 每 天 原始 图 像 数据 28 张 ， 共 计 112 张 。 经 
过 滑动 步 长 裁剪 后 ， 每 张 原始 图 像 被 裁剪 成 12 
ik 960 X 960 px 的 图 像 ， 共 计 1344 张 。 考 虑 到 图 
像 的 质量 问题 ， 手 动 剔除 了 过 度 曝 光 、 质 量 较 低 
的 图 像 。 经 过 筛选 后 ， 剩 余 1188 张 图 像 构成 试 
验 一 数据 集 。 将 此 数据 集 按 照 7:3 的 比例 划分 为 
训练 集 和 测试 集 。 对 于 试验 二 ， 选 取 玉 米 刚 出 苗 
时 期 的 表 型 平台 获取 的 图 像 作 为 数据 集 ， 即 7 月 
28 日 至 8 月 3 日 ,共计 6 天 。 分 别 选取 每 天 原始 


图 像 数 据 150 张 ， 共 计 1200 张 。 经 过 缩放 后 放 人 和 人 
试验 二 数据 集 。 同 时 由 于 所 选取 日 期 的 天 气 情况 
不 同 〈 即 同时 包括 了 晴天 和 阴 天 )， 能 够 保证 不 
同 光 照 条 件 下 模型 的 泛 化 性 能 。 

本 人 研究 最 终 数 据 集 组 成 如 表 1 所 示 。 图 5 展 
示 了 两 种 平台 数据 分 别 在 不 同 光照 条 件 下 预 处 理 
后 的 图 像 及 其 标注 ， 其 中 图 5 (a) 为 不 同 光照 条 
件 下 无 人 机 平台 图 像 及 其 标注 ， 图 5 (b) 为 不 同 
光照 条 件 下 表 型 平台 图 像 及 其 标注 。 


2.3 玉米 幼苗 检测 网 络 


本 研究 基于 卷 积 神经 网 络 在 图 像 特征 提取 上 
的 优异 表现 ， 构 建 了 基于 Faster R-CNN 玉米 出 苗 
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表 1 数据 集 组 成 
Table 1 Composition of data set 


数据 来 源 “训练 集 图 像 数量 / 张 测试 集 图 像 数 量 / 张 总 数 / 张 


无 人 机 平台 832 356 1188 
田间 表 型 平台 840 360 1200 
总 数 1672 716 2388 


2.3.2 ”ResNet50 特 征 提取 网 络 

本 研究 以 田间 玉米 冠 层 图 像 为 数据 ， 进 行 出 
苗 动 态 检测 。 田 间 场 景 比较 复杂 ， 不 同 光 照 和 不 
同 采集 装置 得 到 的 图 像 具 有 很 大 的 差异 ， 传 统 的 
Faster R-CNN 网 络 中 特征 提取 网 络 为 VGG。 
VGG 结构 层次 相对 较 浅 ， 难 以 达到 预期 效果 ， 
因此 本 研究 在 Faster R-CNN 网 络 基础 上 设计 应 用 


动态 检测 模型 ， 该 模型 以 无 人 机 和 田间 作物 高 通 
量 表 型 平台 采集 的 玉米 冠 层 图 像 为 数据 源 ， 对 玉 
米田 间 出 苗 状 况 进行 监测 。 玉 米 出 苗 网 络 的 检测 
过 程 如 图 6 所 示 。 

2.3.1 Faster R-CNN 模型 框架 

本 研究 采用 Faster R-CNN 深度 学 习 模 型 作为 
基础 框架 ， 其 网 络 结构 如 图 7 所 示 。 

由 图 7 可 见 ，Faster R-CNN 网 络 主 要 有 四 个 
主要 内 容 。 首 先是 卷 积 层 对 输入 的 图 片 Faster 
R-CNN 使 用 一 组 基础 的 conv+relu+pooling 层 提 
取 图 片 的 特征 图 (Feature map)， 用 于 后 续 候 选 
框 检 测 网 络 (Region Proposal Network) 和 全 连 
接 层 。 在 RPN 层 中 使 用 尺寸 为 3X3 px 的 滑动 窗 
口 遍 历 该 特征 图 ， 以 每 个 锚 点 (滑动 窗口 中 心 ) 
为 中 心 ， 设计 不 同 的 长 宽 比 生成 多 尺度 候选 区 
Ho ROI Pooling 层 在 此 基础 上 提取 候选 特征 图 
(Proposal Feature Maps) ， 得 到 固定 尺寸 的 候选 
特征 。 最 后 经 过 分 类 和 回归 ， 输 出 候选 区 所 属 的 
类 和 候选 区 域 在 图 中 的 精确 位 置 。 


Ee 


(a) AM 


残 差 (Residual) 学 习 单元 ， 使 用 ResNet50 作为 
特征 提取 网 络 。 

研究 中 用 到 的 特征 提取 网 络 ResNet 50 结 构 
如 图 8 所 示 。ResNet 50 共 有 5 个 编码 层 ， 第 一 个 
编码 层 是 由 卷 积 层 和 池 化 层 构成 ， 后 面 4 个 编码 
层 就 是 4 个 残 差 块 。 残 差 结构 中 包括 两 个 分 文 ， 
其 中 ， 第 一 个 分 支 是 使 用 三 个 卷 积 层 、 批 归 一 化 
层 以 及 修正 线性 单元 (Rectified Linear Unit，Re- 
Lu) °°) 层 进 行 特征 处 理 ， 而 另 一 个 分 支 则 是 通过 
直接 映射 处 理 。 在 使 用 特征 映射 融合 将 这 两 个 分 
文集 成 起 来 后 ， 整 个 网 络 只 需要 学 习 输 入 和 输出 
之 间 的 差异 ,简化 了 学 习 的 目标 和 难度 。 表 2 展 
示 了 特征 提取 网 络 的 具体 参数 配置 。 
23.3 激活 函数 与 损失 函数 

本 研究 中 网 络 训 练 时 选取 ReLu 作 为 激活 函 
数 ， 当 输入 值 为 负 时 ，ReLu 函数 的 输出 值 恒 为 
0; 当 输 入 值 为 正 时 ，ReLu 函数 的 值 与 输入 值 相 
等 ， Bl: 


(b) 田 间作 物 高 通 量 表 型 平台 


AS 不 同 光照 条 件 下 的 可 见 光 图 像 及 其 标注 


Fig. 5 RGB images and their labels under different light conditions 
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本 人 研究 模型 的 损失 函数 主要 由 两 部 分 组 成 ， 
其 中 第 一 部 分 是 分 类 损失 ” ， 其 具体 公式 如 下 : 


1 
之 (PP (2) 


其 中 ， 疡 为 第 ?个 检测 框 的 预测 值 ， 当 预测 
值 与 标注 区 域 的 重奏 区 域 大 于 0.7 时 六 =1， 当 预 
测 值 与 标注 区 域 的 重大 区 域 小 于 0.3 时 =0; Nes 
表示 网 络 训练 过 程 中 生成 的 256 个 检测 框 。 

第 二 部 分 是 回归 损失 ， 用 于 确定 网 络 训练 过 


reg 

HP, Ze AN UI ART Be TOU AEE AY WEE 
表示 训练 阶段 相对 于 实际 的 偏 移 量 ; 入 是 平衡 回 
归 损 失 和 分 类 损失 的 参数 。 


结果 与 分 析 


3.1 试验 参数 设置 及 训练 过 程 分 析 
模型 训练 硬件 平台 采用 Intel (R) Xeon 
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(R) CPU E5-2683 v3 Wheat, 128 GB 内 存 ， 两 
Ik GTX 1070Ti 显 卡 ， 以 及 8GB 显存 。 软 件 环境 
在 Windows 10 操 作 系 统 下 进行 配置 ， 语 言 开 发 
环境 为 Python3.6、 Anaconda3 和 TensorFlow 
113.26 

选择 随机 梯度 下 降 法 (Stochastic Gradient 
Descent, SGD) 来 更 新 学 习 率 ， 从 而 对 Faster R- 
CNN 网 络 进行 训练 。 训 练 时 将 初始 学 习 率 设置 
为 1e“， 误 减 率 设置 为 0.9。 为 了 加 快 训练 速度 和 
训练 初期 防止 权 值 被 破坏 ， 在 迭代 前 20 个 epoch 
时 候 ， 冻 结 一 部 分 网 络 权 值 的 更 新 ， 迭 代 20 个 
epoch 之 后 把 所 有 神经 网 络 进行 解冻 训练 ， 同 时 
将 学 习 率 调整 为 le ， 豪 减 率 依然 设置 为 0.9。 设 
置 网 络 训练 的 迭代 次 数 为 500 个 epoch， 每 个 ep- 
och 训 练 1000 步 。 训 练 Loss 曲线 如 图 9 所 示 。 


损失 值 
So 
A 


0 100 200 300 400 
WREAK BK 
图 9 Faster R-CNN 模型 训练 Loss 曲线 


Fig. 9 Loss value curve of Faster R-CNN 


由 图 9 可 以 看 出 ， 模 型 在 前 40 个 批 次 损失 快 
速 下 降 ，40 个 批 次 后 模型 的 损失 曲线 趋 于 平稳 。 
不 断 对 模型 进行 训练 ， 直 到 损失 趋 于 稳定 并 不 再 
变化 ， 最 终 扩 代 到 500 次 时 ,停止 训练 。 


3.2 模型 训练 结果 


该 模型 对 于 无 人 机 可 见 光 以 及 田间 作物 高 通 
量 表 型 平台 可 见 光 两 种 图 像 在 不 同 光照 条 件 下 的 
玉米 幼苗 检测 效果 如 图 10 所 示 。 直 观 上 可 以 看 
tH, ， 以 ResNet50 作为 特征 提取 网 络 进行 的 幼苗 
检测 ， 有 具有 更 好 的 检测 结果 ， 而 且 晴 天 检测 结 
优 于 阴 天 检测 结果 。 表 型 平台 图 像 中 基本 所 有 出 
苗 都 被 有 效 地 检测 出 来 ， 而 无 人 机 图 像 中 有 很 少 


一 部 分 出 苗 的 玉米 没有 被 检测 出 来 。 
3.3 评价 指标 

对 训练 结束 之 后 的 模型 进行 性 能 判断 ， 对 于 
分 类 模型 通常 采用 精确 率 (Precision) 、 召 回 率 
(Recall) 、 交 并 比 (Intersection Over Union, 
IOU) 作为 评价 指标 ， 而 平均 绝对 误差 (Mean 
Absolute Error，MAE) 通常 被 用 来 评价 计数 模 
型 的 性 能 。 本 研究 采用 以 上 4 个 评价 指标 来 对 模 
型 的 检测 计数 性 能 进行 客观 的 评估 。 各 评价 指标 


7P 

二 (4) 
7P 

Re (5) 


其 中 ，P 为 Precision， 表 示 在 所 有 模型 预测 
为 玉米 幼苗 的 结果 中 ， 预 测 正 确 数 量 占 总 数 的 比 
fil; RX Recall, 表示 模型 预测 为 玉米 幼苗 的 数 
量 占 实际 幼苗 数量 的 比例 ; TP (True Positive) 
表示 正 阳 性 是 指 样本 预测 值 为 正 实际 也 为 正 ; 
FP (False Positive) 表示 假 阳性 是 指 样本 预测 值 
为 正 实 际 为 负 ; FN (False Negative) 表示 假 阴 
性 是 指 样本 预测 值 为 负 实际 为 正 的 。 
A4 NBI 
AUB] 


其 中 ，1OU 表 示 模 型 预测 的 边界 框 与 真实 标 
注 的 边界 框 的 交集 和 并 集 的 比值 ;A 表示 模型 预 
测 的 边界 框 ; B 表 示人 工 标注 的 边界 框 即 为 真 
实 值 。 

MAE = 5" | -| (7) 

其 中 ,3, 表 示 预 测 值 ，y, 表 示 真 实 值 ; 了 ,和 y， 
可 以 是 任意 形状 ， 每 个 形状 包含 mn 个 元 素 。MA4E 
即 为 绝对 误差 的 平均 值 ， 可 以 更 好 地 反映 预测 值 
误差 的 实际 情况 ,平均 绝对 误差 值 越 小 即 表示 模 
型 训练 的 效果 越 好 。 

根据 上 述 所 列 出 的 评价 指标 对 无 人 机 图 像 和 
表 型 平台 图 像 进行 分 析 ， 结 果 如 表 3 一 表 S 所 示 。 
图 11 (97 页 ) 为 模型 在 不 同 平台 和 不 同 天 气 下 
输出 的 P-R 曲线 。PR 曲线 中 将 recall 设置 为 横 坐 


IOU = (6) 
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原始 图 像 VGG16 ResNet50 


(a) 不 同 光照 条 件 下 表 型 平台 获取 的 可 见 光 图 像 的 玉米 幼苗 检测 效果 图 


阴 天 


seadiine 0 75 G74), 


原始 图 像 ResNet50 
(b) 不 同 光照 条 件 下 无 人 机 平台 获取 的 可 见 光 图 像 的 玉米 幼苗 检测 效果 图 
图 10 不 同 光照 条 件 下 表 型 平台 和 无 人 机 平台 获取 的 可 见 光 图 像 的 玉米 幼苗 检测 效果 图 


Fig. 10 The effect of maize seedling detection on visible light images acquired by HTPP and UAV under different lighting 


conditions 
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ËR, precision 设置 为 纵 坐 标 。 曲 线 与 坐标 周 包 于 
的 面积 为 AP，AP 越 大 ， 说 明 检 测 结果 越 好 
表 3 基于 VGG 和 ResNet 的 Faster R-CNN 在 测试 集 输 
出 结果 对 比 
Table 3 Comparison of output results of Faster R-CNN 
based on VGG and ResNet in the test set 


特征 提取 网 络  P/% RI% IOU MAE 
VGG 89.42 86.81 75.04 6.2816 
ResNet 91.87 90.13 82.57 5.6361 


表 4 本 研究 模型 在 表 型 平台 晴天 和 阴 天 图 像 输出 结果 比较 


Table 4 Comparison of the output results ofthe model in the 


images of HTPP on sunny and cloudy days 


光照 情况 PI% RI% IOU MAE 
EK 95.67 93.36 85.57 4.3682 
BAK 91.36 89.23 83.04 5.2314 


表 5 本 研究 模型 在 无 人 机 晴天 和 阴 天 图 像 输出 结果 比较 


Table 5 Comparison of the output results of the model in the 


UAV images on sunny and cloudy days 


光照 情况 PI% RI% IOU MAE 
晴天 91.43 89.46 86.01 5.3521 
阴 天 89.77 87.81 83.04 5.9564 


由 表 3 可 以 看 到 本 研究 基于 ResNet 特征 提取 
网 络 的 Faster R-CNN 在 整体 测试 集 上 的 表现 要 优 
于 传统 的 Faster R-CNN 模 型 。 由 表 4 和 表 5 可 以 
看 出 本 研究 模型 晴天 时 在 高 通 量 表 型 平台 上 精度 
可 以 达到 95.67%， 表 现 要 优 于 无 人 机 平台 精度 
(91.43%) ， 阴 天 时 在 表 型 平台 和 无 人 机 平台 上 的 
识别 精度 也 可 以 达到 91.36% 和 89.77%。 改 进 后 
HY) Faster R-CNN 模型 可 以 满足 对 高 通 量 表 型 平台 
和 无 人 机 平台 对 出 苗 检 测 的 要 求 。 


3.4 玉米 出 苗 动态 监测 


考虑 到 田间 作物 高 通 量 表 型 平台 能 够 获取 
每 天 的 时 序 性 可 见 光 图 像 (图 12)。 本 研究 采 
用 其 所 获取 图 像 实现 不 同 品种 玉米 的 动态 出 苗 
检测 。 平 台 和 覆盖 地 块 中 分 别 以 三 种 不 同 密度 种 
植 了 AD268 和 XD20 两 种 玉米 植株 ， 每 种 密度 四 


次 重复 。 除 去 保护 行 ， 共 24 行 , 行 长 为 2.5 m 
即 密度 为 25,000 株 /ha 每 行 种 植 6 棵 植株 ， 密 
度 为 40,000 株 /ha 每 行 种 植 9 棵 植株 ， 密 度 为 
55,000 株 /ha 每 行 种 植 12 棵 植株 。 各 品种 玉米 于 7 
月 23 日 同时 播种 。 使 用 本 研究 训练 的 模型 从 7 月 
26 日 CATH EA) 开始 对 各 品种 玉米 连续 10 d 的 冠 
层 图 像 进 行 出 苗 检测 计数 ， 直 至 所 有 植株 完全 出 
苗 。 统 计 并 绘制 了 同一 个 品种 不 同 密度 的 植株 出 
苗 数 量 的 变化 曲线 ， 如 图 12 所 示 。 

从 图 12 (a) 可 以 看 出 AD268 品种 玉米 植株 
于 7 月 27 日 开始 出 苗 ， 于 8 月 4 日 全 部 出 苗 结 
而 图 12 (b) 的 XD20 品种 玉米 植株 同样 于 7 月 
27 日 开始 出 苗 ， 三 种 不 同 密度 植株 在 8 月 1 日 均 
全 部 出 苗 。 为 了 更 加 直观 地 展示 不 同 密度 玉米 植 
株 的 出 茵 情况 ， 分 别 统计 了 不 同 种 类 和 不 同 种 植 
密度 的 玉米 植株 从 第 一 天 出 苗 至 出 苗 结束 所 需 天 
数 ， 如 表 6 所 示 。 

结合 图 12 可知 ，XD20 品种 的 玉米 植株 比 
AD268 品种 的 玉米 植株 从 开始 出 苗 到 结束 所 需 的 
时 间 更 短 即 出 茵 更 整齐 。 而 在 本 次 试验 中 ， 在 相 
同 种 植 条 件 及 灌溉 条 件 下 ， 密 度 为 25,000 株 /ha 
的 玉米 植株 从 开始 出 苗 至 结束 所 需 时 间 相 对 另 两 
种 密度 玉米 植株 更 短 。 利 用 本 研究 所 提 模 型 进行 
动态 出 茵 检测 结果 与 人 工 实测 结果 保持 一 致 ， 说 
明 本 研究 所 提 方 法 具有 一 定 的 鲁 棒 性 和 泛 化 性 。 


4 结论 


本 人 研究 以 无 人 机 平台 可 见 光 图 像 以 及 田间 作 
物 表 型 高 通 量 采集 平台 可 见 光 图 像 两 种 数据 源 构 
建 了 不 同 光照 条 件 下 玉米 冠 层 图 像 数 据 集 。 使 用 
Resnet 50 代替 VGG 16 来 优化 Faster R-CNN 模 
型 ， 对 所 获取 共计 2388 张 图 像 进行 了 训练 和 测 
试 。 优 化 后 的 模型 在 测试 集 上 的 平均 识别 精度 为 
91.87%， 并 对 在 不 同 平台 和 不 同 光照 下 的 模型 检 
测 精 度 进 行 了 对 比 。 其 中 ， 高 通 量 表 型 平台 对 出 
苗 进行 预测 时 ， 晴 天 和 阴 天 的 识别 精度 可 以 分 别 
达到 95.67% 和 91.63%。 无 人 机 平台 对 出 苗 进 行 
预测 时 ， 晴 天 和 阴 天 的 识别 精度 可 以 分 别 达到 
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class: 95.67% = seeding AP 


class: 91.36% = seeding AP 


91.36% 和 89.77%, WEE 24 R 


精确 率 


精确 率 


表明 ， 应 用 本 模型 可 实现 在 田 
间作 物 高 通 量 表 型 平台 上 玉米 
幼苗 检测 ， 达 到 可 观 的 效果 。 
而 在 无 人 机 平台 上 的 检测 精度 
却 相 对 偏 低 。 这 是 由 于 两 种 平 


召回 率 
(a) 睛 天 时 表 型 平台 输出 P-R 曲线 


class: 91.43% = seeding AP 


“0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 


召回 率 | i 台所 获取 的 图 像 空 


b) 阴 天 时 表 型 平台 输出 P-R 曲线 


class: 89.77% = seeding AP 


0.6 0.8 1.0 


间 分 辩 率 大 
小 不 一 样 、 采 用 的 预 处 理 方式 
也 不 一 样 。 导 致 处 理 后 两 种 平 


合 的 图 像 数 据 所 包含 的 玉米 幼 
苗 数 量 也 不 一 致 ， 因 此 在 进行 
幼苗 检测 时 会 出 现 不 同 平台 的 
检测 精度 差 。 

在 此 基础 上 ， 根 据 田 间作 


(ee oN 
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(c) 晴 天 时 无 人 机 平台 输出 P-R 曲线 


All 两 种 表 型 平台 在 阴 天 和 晴天 时 输出 P-R 曲线 


(d) 阴 天 时 无 人 机 平台 输出 P-- 民 曲线 


“HER l 物 高 通 量 表 型 平台 所 获取 的 时 


序 图 像 对 玉米 出 苗 数 量变 化 进 
行 统计 ， 分 析 了 本 试验 中 
AD268 和 XD20 两 个 品种 玉米 


Fig. 11 P-R curves of two phenotypic platforms on cloudy and sunny days 


7/26 7/27 7/28 7/29 7/30 7/31 8/1 8/2 8/3 8/4 7/26 7/27 
月 /日 


JER GRE 
图 12 玉米 出 苗 数量 变化 曲线 


(a)AD268 不 同 密 变化 曲线 


Fig. 12 The curves ofthe number of maize emergence 


表 6 不 同 品种 不 同 密度 玉米 植株 出 苗 至 结束 所 需 天 数 统计 表 
Table 6 Statistics of the number of days ae from emer- 


gence to end of different varieties and different densities meter 


品种 种 植 密度 /( 株 *ha-!) 出 苗 天 数 /天 


7/28 7/29 7/30 7/31 8/1 8/2 8/3 8/4 
月 


(b)XD20 不 同 密度 


在 三 种 不 同 种 植 密度 条 件 下 ， 
从 出 苗 开始 至 结束 所 需 时 间 。 
结果 表明 ， 不 同 品种 的 出 苗 持 
续 时 间 存 在 显著 差异 ，XD20 
相 比 AD268 出 苗 持续 时 间 更 
短 ， 出 茵 更 整齐 。 本 研究 方法 
具备 一 定 的 准确 性 和 科学 性 ， 
同时 也 为 使 用 无 人 机 和 表 型 平 
台 获 取 玉 米 冠 层 图 像 进 行 识别 
出 首 数 量变 化 烛 线 计数 任务 及 出 苗 动 态 检测 提供 
了 一 定 的 理论 依据 和 借鉴 
价值 。 
S a 
开始 连续 10 天 所 获取 的 时 序 可 见 光 图 像 ， 
MRA A AEE N en 


25,000 5 
AD 40,000 
55,000 
25,000 
XD 40,000 
55,000 


a A UIN œ 


度 下 的 出 苗 动 态 进行 了 监测 。 以 上 结果 说 明 本 研 
究 建立 的 基于 深度 学 习 的 玉米 出 苗 检 测 模型 不 仅 
可 以 实现 无 人 机 可 见 光 图 像 中 玉米 幼苗 的 准确 识 
别 与 检测 ， 也 能 够 通过 田间 作物 表 型 高 通 量 平 台 
实现 对 玉米 出 苗 的 动态 连续 监测 。 通 过 对 两 种 平 
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台 的 对 比 ， 田 间 表 型 高 通 量 平 台 相 对 于 无 人 机 表 
型 平台 所 获取 的 图 像 更 加 精细 ， 时 序 性 更 强 ， 所 
以 出 茵 检测 的 准确 度 更 高 ， 能 够 更 好 地 为 玉米 播 
种 质量 和 种 子 质量 评价 提供 技术 支 撑 ， 为 田间 大 
面积 测定 出 苗 率 及 产量 佑 算 提 供 参 考 。 
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High-Throughput Dynamic Monitoring Method of Field 
Maize Seedling 
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of Digital Plant, National Engineering Research Center for Information Technology in Agriculture, Beijing 100097, 
China; 3. College of Information Technology, Shanghai Ocean University, Shanghai 201306, China) 


Abstract: At present, the dynamic detection and monitoring of maize seedling mainly rely on manual observation, which is time- 
consuming and laborious, and only small quadrats can be selected to estimate the overall emergence situation. In this research, 
two kinds of data sources, the high-time-series RGB images obtained by the plant high-throughput phenotypic platform (HTPP) 
and the RGB images obtained by the unmanned aerial vehicle (UAV) platform, were used to construct the image data set of 
maize seedling process under different light conditions. Considering the complex background and uneven illumination in the 
field environment, a residual unit based on the Faster R-CNN was built and ResNet50 was used as a new feature extraction net- 
work to optimize Faster R-CNN to realize the detection and counting of maize seedlings in complex field environment. Then, 
based on the high time series image data obtained by the HTPP, the dynamic continuous monitoring of maize seedlings of differ- 
ent varieties and densities was carried out, and the seedling duration and uniformity of each maize variety were evaluated and 
analyzed. The experimental results showed that the recognition accuracy of the proposed method was 95.67% in sunny days and 
91.36% in cloudy days when it was applied to the phenotypic platform in the field. When applied to the UAV platform to moni- 
tor the emergence of maize, the recognition accuracy of sunny and cloudy days was 91.43% and 89.77% respectively. The detec- 
tion accuracy of the phenotyping platform image was higher, which could meet the needs of automatic detection of maize emer- 
gence in actual application scenarios. In order to further verify the robustness and generalization of the model, HTPP was used 
to obtain time series data, and the dynamic emergence of maize was analyzed. The results showed that the dynamic emergence 
results obtained by HTPP were consistent with the manual observation results, which shows that the model proposed in this re- 
search is robust and generalizable. 


Key words: field maize; Faster R-CNN; recognition; counting; dynamic seedling detection 
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